RNA.seq		                  pacote:unknown		                      R Documentation

~~ Processa e analisa dados brutos de contagem de genes e compara diferentes condies experimentais~~


Descrio:
Utiliza dados brutos de contagem de genes, oriundos de experimentos de sequenciamento de RNA em larga escala, analisando-os e comparando diferentes condies experimentais.

	
Uso:
RNA.seq(data, ncon)


Argumentos:
data		data frame ou matriz com os dados brutos de contagem de genes.
ncon		nmero de condies experimentais a serem analisadas.


Detalhes:
O data frame com os dados deve ser importado utilizando header = TRUE, sendo que os genes devem estar indicados nas linhas e as condies experimentais nas colunas.


Valor:
HeatMaps.pdf: retorna um arquivo do tipo .pdf com dois grficos do tipo HeatMap, sendo o primeiro comparando as condies experimentais baseando-se nos valores de uma matriz de distncia e o segundo comparando as condies baseando-se nos seus respectivos valores normalizados de contagem de genes. 


plotMA.pdf: retorna um arquivo do tipo .pdf com grficos de disperso utilizando valores de comparao de dados de contagem normalizados entre duas variveis; todas as variveis sero comparadas entre si, duas a duas. 


baseMeans.txt: retorna um arquivo do tipo .txt contendo uma tabela com os valores de baseMeans e baseVar para cada gene analisado.


RPKM.txt: retorna um arquivo do tipo .txt contendo uma tabela com os valores de contagem de genes normalizados segundo o clculo de RPKM (Reads Per Kilobase per Million mapped reads).


binomtest[i,j].txt: retorna um arquivo do tipo .txt contendo uma tabela com dados obtidos de comparaes entre duas das variveis analisadas. Ser gerado um arquivo para cada comparao separadamente; i e j correspondem s variveis a serem comparadas.
	

Autor:
Paulo Marques Pierry
Doutorando do Programa de Ps-graduao em Cincias, rea Bioqumica, do IQ/USP.
pmpierry@gmail.com


Agradecimentos:
Agradeo aos monitores da disciplina Marilia Gaiarsa, Danilo Muniz e Hamanda Cavalheri pela fundamental ajuda durante o desenvolvimento desta funo.


Referncias:
Gentleman, R.C., Carey, V.J., Bates, D.M., Bolstad, B., Dettling M., Dudoit, S., Ellis, B., Gautier, L., Ge, Y., Gentry, J., Hornik, K., Hothorn, T., Huber, W., Iacus, S., Irizarry, R., Leisch, F., Li, C., Maechler, M., Rossini, A.J., Sawitzki, G., Smith, C., Smyth, G., Tierney, L., Yang, J.Y.H., Zhang, J. 2004. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology, 5:R80.

Anders, S., Huber, W. 2010. Differential expression analysis for sequence count data. Genome Biology, 11:R106.


Exemplo:	
# Baixar os arquivos "teste_vibrio_mean.csv" e "gene.coord.csv" e salv-los no diretrio de trabalho que ser usado no R.	
# teste_vibrio_mean.csv: contagem de genes expressos em diferentes condies de crescimento da bactria patognica Vibrio cholerae tanto in vivo como in vitro.
# gene.coord.csv: coordenadas gnicas de todos os genes analisados da bactria Vibrio cholerae.

data <- read.table("teste_vibrio_mean.csv",  header=T,  sep=";") 
gene.coord <- read.table("gene.coord.csv",  header=T,  sep=";")

#Analisar os dados de expresso gnica de cinco condies experimentais de crescimento da bactria Vibrio cholerae.
RNA.seq(data, 5)


Referncia dos dados do exemplo:
Mandlik, A., Livny, J., Robins, W.P., Ritchie, J.M., Mekalanos, J.J., Waldor, M.K. 2011. RNA-Seq-Based Monitoring of Infection-Linked Changes in Vibrio cholerae Gene Expression. Cell Host & Microbe, 10:165-174.